Ames Fire Insurance
🔥 우리는 LS 화재보험사

에임즈(Ames) 시에 새로운 보험상품을 출시하려 합니다.
그런데 이 지역은 화재 위험도가 어떤지,
보험금은 얼마로 책정해야 수익이 날 수 있을지,
아무도 정확히 모릅니다.

  • 📦 주택 가격은 어떤지
  • 🧱 자재는 화재에 강한지
  • 🔥 위험 지역은 어디인지
  • 💰 보험 수익은 어디서 발생하는지
이제 데이터를 기반으로,
에임즈 시의 보험료를 직접 산정해보겠습니다.
📌 프로젝트 배경

최근 기후 변화노후화된 주택 문제로,
미국 내 화재 사고가 증가하고 있습니다.
캘리포니아 산불 사례처럼, 보험사는 막대한 손실을 입을 수 있습니다.

그렇다면, 우리는 사전 예측과 리스크 분석을 통해
보다 정밀한 보험료 책정이 가능할까요?

Ames Housing 데이터를 기반으로
데이터 기반 화재보험 모델을 구축합니다.
🧭 분석 흐름 요약

1️⃣ 화재 위험 시각화
2️⃣ 화재 대응 자원 분석
3️⃣ 피해액 예측 모델링
4️⃣ 보험금 산정 공식 설계
5️⃣ 추천 리스트 & 정책 제안

🗺️ 1. 위험도 기반 주택 시각화
  • Plotly 지도 기반으로 각 주택의 Risk_Level을 색상으로 시각화
  • 소방서 위치도 함께 시각화
📋 2. 화재 위험도 산정 기준표
  • 자재별 화재 위험도 가중치:
    • RoofMatl: 30%
    • Exterior1st: 30%
    • Exterior2nd: 10%
    • MasVnrType: 10%
    • WoodDeckSF: 20%
📊 3. 위험도별 주택수량 막대그래프
# sns.countplot(x='Risk_Level', data=dataset)
📊 탭 구조 예시
📐 2. 건물 피해 단가 기준 계산식 (근거)
  • TotalSF = TotalBsmtSF + 1stFlrSF + 2ndFlrSF
  • LandValue, BuildingValue는 가중 평균 방식으로 분리
  • 피해 단가: BuildingValue / TotalSF
📉 3. 가격 분포 막대그래프
# sns.histplot(data=dataset, x='BuildingPricePerTotalSF')
📝 1에 대한 해석
  • 건물 피해 단가 기반 보험료 산정이 타당함을 확인
  • 고가 주택일수록 피해 예상액이 커짐
🔥 분석 목적 요약

화재 위험 등급이 높을수록 주택 가격이 낮은가? 위험도와 가격 간의 관계를 통계적으로 검정하고, 그 결과를 시각화와 함께 해석합니다.

📊 아노바 검정 결과
  • ✅ 위험도별 가격 평균 차이 있음
  • ✅ Bartlett 등분산성 검정 통과
  • ✅ 사후검정(Dunnett’s Test): 일부 그룹 간 유의한 차이 존재
📈 위험도별 주택가격 Box Plot
🔍 결과 해석
  • 평균 가격:
    위험도 1 < 2 < 3 < … < 5
    위험도가 높을수록 평균 가격은 낮은 경향

  • 하지만,
    위험도가 낮다고 가장 비싼 집은 아님

  • 가격은 취향 차이, 재료, 위치 등의
    다양한 요인의 영향을 받음

📌 결론 요약
  • 🔥 화재 위험도는 가격에 통계적으로 유의미한 영향을 미칩니다.
  • 🏷️ 하지만, 가격은 단일 요인이 아닌 복합 요인의 결과입니다.
    (예: 부촌 = 안전 + 디자인 + 입지)
요소 설명
📌 Shapiro-Wilk 검정 p-value 박스 0.01 이하 → 정규성 부족 명시
📉 잔차 plot (fitted vs residual) 선형성 or 등분산성 확인 시 사용
🗂️ 필터 추가 위험도별/지역별 결과 필터링 가능
📌 분석 목적

거래가 없는 주택에도 적용 가능한 예측 모델을 통해 보험료를 산정합니다.

🔧 보험료 예측 모델
  • 사용 모델: Lasso, Ridge, ElasticNet
  • 주요 변수: 위험도, 자재, 노후도, 평단가 등
  • 성능 평가: R², RMSE, 교차검증
# 회귀 모델 학습 및 평가 코드
🗺️ 예측 보험료 지도 시각화
  • 각 주택의 보험료 예측값을 지도에 시각화
  • 색상 = 보험료 크기, Hover 시 상세 금액 표시
# Scattermapbox 지도 시각화 코드
💰 보험료 산정 공식

예상 보험료 = 예측 피해액 × 화재 위험 가중치 × 자재 손상률 × 노후도 계수

📌 분석 목적

에임즈 전체 보험료 총합과 보장 총액을 바탕으로 손익분기점을 분석합니다.

🎯 위험-수익 매트릭스 시각화

각 구역(또는 주택)을 위험도와 수익성 축으로 표현한 4분면 분석입니다.
수익이 낮고 위험이 높은 지역은 보험 인수 대상에서 제외하는 전략이 필요합니다.

📈 손익 시나리오 그래프
# x축: 보장 비율 (%)
# y축: 수익 또는 손실 (USD)
📌 결론 요약
  • 보험료 모델로 모든 주택의 보험료 산정 가능
  • 손익 시나리오 분석을 통해 수익 구조 명확화
  • 데이터 기반 보험 전략 수립 기반 마련